from urllib import request
import re

'''
@电影、图片、主演、上映时间、评分的正则表达式
'''
filmPat='class="name"><a .*?>(.*?)</a>'
picPat='<img data-src="(.*?)".*?/>'
starPat='class="star">(.*?)</p>'
timePat='class="releasetime">(.*?)</p>'
scorePat='class="integer">(.*?)</i><i class="fraction">(.*?)</i>'

fh=open('D:\\python\\python练习\\猫眼电影Top100.txt','w')#写入文件
for i in range(0,10):#页数
  url='http://maoyan.com/board/4?offset='+str(i*10)
  req=request.Request(url)
  res=request.urlopen(req).read().decode("utf-8")

  film=re.compile(filmPat,re.S).findall(res)
  pic=re.compile(picPat,re.S).findall(res)
  star=re.compile(starPat,re.S).findall(res)
  time=re.compile(timePat,re.S).findall(res)
  score=re.compile(scorePat,re.S).findall(res)
  for j in range(1,11):#序号
    number=(i+1)*j
    fh.write("【序号："+str(number)+";电影："+str(film[i])+";图片地址："+str(pic[i])+";"+str(star[i])+";"+str(time[i])+";评分："+str(score[i][0])+str(score[i][1])+"】\n")
fh.close()
